Dynamická identifikace klíčových slov

2.4.2003

Že je možno charakterizovat i obsah relativně dlouhého dokumentu pomocí několika klíčových slov je obecně známá věc. Jon Kleinberg z Cornellovy University však tento poznatek obohatil studiem vývoje výskytu klíčových slov v čase. Ukázal, že studiem velkého množství dokumentů je pomocí náhlých změn frekvencí několika dominantních slov možno poměrně přesně charakterizovat, co hýbe v daný moment společností. Toto tvrzení ilustroval nejen na příkladech z běžného života na americké universitě, kde např. náhlý nárůst frekvence slova "předtermín" ve studentských e-mailech jasně signalizuje začátek zkouškového období, ale i hlubokým exkurzem do americké historie. Analýzou prezidentských zpráv "O stavu Unie" (a dalších dobových písemností) ukázal, že pro konec osmnáctého století bylo charakteristické slovo "gentleman", v roce 1801 se náhle vynořilo slovo "milice", v roce 1833 explodovalo slovo "banka", v roce 1848 pak slovo "Kalifornie" (bylo to v období zlaté horečky), v roce 1859 slovo "otroci", v roce 1861 slovo "vzpoura" (začátek války Severu proti Jihu), v roce 1862 slovo "emancipace" v roce 1867 slovo "noviny", v roce 1877 slovo "měna", v roce 1901 slovo "lesy", v roce 1907 slovo "mezistátní" (míněno mezi státy USA), v roce 1919 slovo "marketing", v roce 1947 slovo "atomová", v roce 1971 slovo "inflace", v roce 1974 slovo "ropa", v roce 1990 slovo "obchod", v roce 1991 slovo "zločinnost", v roce 1992 slovo "zdraví" a v roce 1992 slovo "učitelé". Kleinbergovo sdělení bylo přijato s velikým zájmem na únorovém zasedání American Association for the Advancement of Science (AAAS), není však jasné, zda tato metoda má nějaké praktické využití.

Odeslat komentář k článku " Dynamická identifikace klíčových slov "



Opište text z obrázku:

Odeslat článek " Dynamická identifikace klíčových slov " e-mailem

Diskuse/Aktualizace